iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 21
0

ImageNet 每年都會舉辦ILSVRC競賽,經過近八年的比賽過程,產生了不少厲害的CNN模型架構,Keras就把他們收率進框架哩,叫做Keras Application。

  1. Xception
  2. VGG16
  3. VGG19
  4. ResNet50
  5. InceptionV3
  6. InceptionResNetV2
  7. MobileNet
    https://ithelp.ithome.com.tw/upload/images/20201001/20130246Hgad8vA4Xi.png
    我今天要討論的是VCG系列

VCG介紹

VGG最重要的概念就是大量使用3X3的捲積層、較小的stride (strides=1)以及Pooling (2X2),論文作者認為較小的捲積層可以提高所得到的資訊量。此外,相對於Alexnet所使用的7X7捲積層,3X3的捲積層也有較高的非線性能力。此外,VGG也證明了深度越深越好!透過較小的filter所疊出來的架構仍然能繼續提高。
https://ithelp.ithome.com.tw/upload/images/20201001/20130246PBCklQx9TH.png

VCG16&VCG19的模型架構

VCG主要貢獻是使用更多的隱藏層,大量的圖片訓練,提高準確率至90%。VGG16/VGG19分別為16層(13個卷積層及3個全連接層)與19層(16個卷積層及3個全連接層),
https://ithelp.ithome.com.tw/upload/images/20201001/20130246M1ssEubJHe.png

https://ithelp.ithome.com.tw/upload/images/20201001/20130246dO7hiWeB3P.png

大家如果有興趣想知道VCG16&VCG19如何實做出來可以參考https://github.com/mc6666/MyNeuralNetwork,由於我還只是一個初學者,我乍看那程式碼只知道因為很多層,導致參數量很多,但實際上的整體規劃我還是要再努力。
參考
https://ithelp.ithome.com.tw/articles/10192162
https://ithelp.ithome.com.tw/articles/10222575


上一篇
CNN-阿拉伯數字辨識
下一篇
CNN-ResNets
系列文
Tensorflow2.030
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言